Rank in Wordlist | Frequency | Word |
---|---|---|
1000 | 59 | יו-ען |
1856 | 31 | וואל-מארט |
2187 | 26 | איי-פאד |
2292 | 25 | יאר-הונדערט |
2554 | 22 | דזשי-עם |
3134 | 17 | אן-סטאר |
3829 | 14 | סי-פי-אר |
4299 | 12 | יו-עס |
4586 | 11 | וועלט-מלחמה |
4861 | 10 | בן-ציון |
5123 | 10 | צווייטער וועלט-מלחמה |
5132 | 10 | צפון-מזרח |
5203 | 10 | תאומים-פרענקל |
5522 | 9 | סי-סי-פי |
5675 | 9 | שניי-מאביל |
5676 | 9 | שניי-מאבילן |
5906 | 8 | דרום-מזרח |
6023 | 8 | לידער-זאַמלונג |
6169 | 8 | פי-על-או |
6374 | 7 | איי-בי-עם |
Rank in Wordlist | Frequency | Word |
---|---|---|
3829 | 14 | סי-פי-אר |
5522 | 9 | סי-סי-פי |
6169 | 8 | פי-על-או |
6374 | 7 | איי-בי-עם |
6417 | 7 | אר-אי-עם |
6812 | 7 | סי-איי-עי |
7156 | 6 | איי-אר-עס |
7266 | 6 | בי-טי-יו |
7710 | 6 | עף-בי-איי |
8150 | 5 | אי-אי-אר |
Rank in Wordlist | Frequency | Word |
---|---|---|
13236 | 3 | יו-עס-עס-אר |
13981 | 3 | ען-אר-אי-עם |
16340 | 2 | אר-סי-עם-פי |
18708 | 2 | יו-עס-עי-טודעי |
20173 | 2 | עי-טי-ענד-טי |
27271 | 1 | איי-סי-או-עס |
33543 | 1 | דזשי-עם-עי-סי |
34203 | 1 | דריי-הונדערט-פיר-און-פופציג |
34755 | 1 | הונדערט-איין-און-פערציג |
34756 | 1 | הונדערט-זעקס-און-פערציג |
Rank in Wordlist | Frequency | Word |
---|---|---|
34203 | 1 | דריי-הונדערט-פיר-און-פופציג |
43424 | 1 | סי-פי-יו-עס-עי |
44095 | 1 | עי-עם-עס-עי-טי |
46759 | 1 | פיר-הונדערט-צוויי-און-פערציג |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters